近年来,薄弱的监督已应用于各种自然语言理解任务。由于技术挑战范围缩小了较弱的长期文档的监督,跨越了数百页,因此在文档理解空间中的应用程序受到限制。在Lexion,我们建立了一个针对长格式(长10-200页)PDF文档量身定制的基于监督的薄弱系统。我们使用此平台来构建数十种语言理解模型,并成功地应用于从商业协议到公司编队文件的各个领域。在本文中,我们在有限的时间,劳动力和培训数据的情况下,通过弱监督进行监督学习的有效性。我们在一周的时间内建立了8个高质量的机器学习模型,借助一小组组成的小组,只有3个注释者与300个文档的数据集一起工作。我们分享有关我们的整体体系结构,如何利用弱监督以及能够实现的结果的一些细节。我们还包括想要尝试替代方法或完善我们的研究人员的数据集。此外,我们阐明了使用PDF格式扫描不良的长格式文档时出现的其他复杂性,以及一些有助于我们在此类数据上实现最新性能的技术。
translated by 谷歌翻译
季节预测$ \ unicode {x2013} $预测温度和降水量为2至6周$ \ unicode {x2013} $,对于有效的水分配,野火管理,干旱和缓解洪水至关重要。最近的国际研究工作提高了操作动力学模型的亚季节能力,但是温度和降水预测技能仍然很差,部分原因是代表动态模型内大气动力学和物理学的顽固错误。为了应对这些错误,我们引入了一种自适应偏置校正(ABC)方法,该方法将最新的动力学预测与使用机器学习的观察结合在一起。当应用于欧洲中等天气预测中心(ECMWF)的领先的亚季节模型时,ABC将温度预测技能提高了60-90%,在美国的连续美国,降水预测技能提高了40-69%基于Shapley队列的实用工作流程,用于解释ABC技能的提高并根据特定的气候条件识别机遇的高技能窗口。
translated by 谷歌翻译
地面穿透雷达(GPR)已被用作树根检验的非破坏性工具。从GPR Radargrams估算从GPR Radargrams的与根系相关的参数都促进了根系健康监测和成像。然而,随着根反射是多根参数和根方向的复杂函数,估计根相关参数的任务是具有挑战性的。现有方法只能在不考虑其他参数和根取向的影响的时间内估计单根参数,导致不同根状况下的估计精度有限。此外,土壤异质性在GPR雷达格中引入了杂波,使数据处理和解释甚至更难。为了解决这些问题,提出了一种名为掩模引导的多偏振积分神经网络(MMI-Net)的新型神经网络架构,以自动估计异构土壤环境中的多个与多种根相关参数。 MMI-Net包括两个子网络:一个掩码,用于预测掩模以突出显示根反射区域以消除干扰环境杂波,以及使用预测掩码的Paranet作为集成,提取,并强调多个中的信息特征的指导Polariemetric radargrams,用于精确估计五个关键的根系相关参数。参数包括根深度,直径,相对介电常数,水平和垂直方向角。实验结果表明,所提出的MMI-Net在这些与相关参数中实现了高估计精度。这是第一项工作,它考虑了根参数和空间方向的组合贡献,并同时估计多个与多个与根相关的参数。本文中实现的数据和代码可以在https://haihan-sun.github.io/gpr.html中找到。
translated by 谷歌翻译
我们基准了一个简单学习模型的亚季节预测工具包,该工具包优于操作实践和最先进的机器学习和深度学习方法。这些模型,由Mouatadid等人引入。 (2022),包括(a)气候++,这是气候学的一种适应性替代品,对于降水而言,准确性9%,比美国运营气候预测系统(CFSV2)高9%,熟练250%; (b)CFSV2 ++,一种学习的CFSV2校正,可将温度和降水精度提高7-8%,技能提高50-275%; (c)持久性++是一种增强的持久性模型,将CFSV2预测与滞后测量相结合,以将温度和降水精度提高6-9%,技能提高40-130%。在整个美国,气候++,CFSV2 ++和持久性++工具包始终优于标准气象基准,最先进的机器和深度学习方法,以及欧洲中等范围的天气预报集合中心。
translated by 谷歌翻译